Modul Zonen OCR, Barcode, QRCode

Zone löschen

Mit der Schaltfläche Zone löschen haben Sie die Möglichkeit eine Zone zu entfernen. Alle Einstellungen der Zone sowie die Zonenmarkierung auf dem Seitenbild werden entfernt.

Zone Testen

Mit der Testfunktion wird die Zone in das erscheinende Textfenster getestet. Dort erscheint der Text, der erkannt oder aus einem Barcode gelesen wurde. Dabei werden alle relevanten Einstellungen für den gelesenen Text berücksichtigt (Anzahl der Worte oder Leerzeichen trimmen).

Name

Der Name der Zone wird oberhalb der Zonenmarkierung angezeigt. Der Name ist wichtig für das Ansprechen der Zoneninhalte mit Variablen (Variablen beinhalten den Zonennamen). Bei der Änderung des Namens ist aus diesem Grunde Vorsicht geboten, da die Variablen (siehe Variablen) möglicherweise bei Scanzielen in der Metadatei-Generierung verwendet wurden (siehe auch Modul Scanziel SMB). Der Name der Zone wird oberhalb der Zonenmarkierung angezeigt.

Variablennamen dürfen keine Sonderzeichen enthalten. Erlaubt sind kleine und große Buchstaben (keine Umlaute o.Ä.), Zahlen und der Punkt ".".
Wird der Variablenname an mehreren Stellen verwendet, können alle Stellen den Variablenwert beeinflussen.

Beachten Sie beim Ändern des Namens der Zone, dass ggf. in Metadateien verwendete Variablen nicht mehr aufgelöst werden können.

Typ

Geben Sie bei Typ an, was in der Zone enthalten ist. Die folgenden Möglichkeiten stehen zur Verfügung.

Barcode 1D

Der Barcode 1D ist ein Code, der im Wesentlichen aus Strichen besteht. Es werden die nachstehenden Typen unterstützt.

Unterstützte Sprachen für OCR-Erkennung

Die Sprachen der OCR-Erkennung können für die zu verarbeitenden Dokumente festgelegt werden (sie ist nicht am Gerät einstellbar). Damit wird die Erkennungsrate für z.B. in kyrillischen Zeichen verfassten Dokumenten verbessert.

Je mehr Sprachen gleichzeitig ausgewählt werden, desto schwieriger wird es für die OCR-Erkennung die richtigen Zeichen auszuwählen, da es z.B. lateinische Schriftzeichen oder Worte gibt, die kyrilischen sehr ähnlich sind. Sie erhalten das beste Ergebnis, wenn die Voreinstellung möglichst nur die (eine) Sprache der gescannten Dokumente enthält. Wird gar keine Sprache ausgewählt wird der Standard (Englisch und Deutsch) verwendet.

Englisch
Deutsch
Russisch
Ukrainisch

Seitentrennung

Anhand des Inhaltes der gelesenen Zone kann veranlasst werden, dass der Scan an dieser Stelle getrennt wird. Entscheidend dafür ist die Bedingung für die Seitentrennung (diese Einstellung wird nur angezeigt, wenn die Seitentrennung aktiv ist).

Technisch betrachtet wird - sobald eine Trennung durchgeführt wird - für jedes getrennte Dokument eine neue Instanz des Workflows gestartet. Diese Instanzen laufen dann über das trennende Zonen-OCR-Modul hinweg und führen den Workflow weiter aus (ggf. kann hier auch ein weiteres Zonen-OCR-Modul folgen).

Nicht trennen: Die Seitentrennung ist nicht aktiviert.

Trennen und behalten: Der Scan wird an der Seiten, an dem die Bedingung für den Zoneninhalt zutrifft getrennt. Die Seite mit der trennenden Zone wird als erste Seite des neuen Dokumentes verwendet.

Trennen und entfernen: Der Scan wird an der Seiten, an dem die Bedingung für den Zoneninhalt zutrifft getrennt. Die Seite mit der trennenden Zone wird aus dem Scan entfernt.

Nach Inhalt gruppieren: Die getrennten Abschnitte mit gleichem Zoneninhalt werden in einer Datei zusammengeführt (in der Reihenfolge, in der sie gescannt wurden). Es entstehen also so viele Dateien, wie es unterschiedliche Zoneninhalte im gescannten Stapel gibt.

Wenn eine Seite mehrere Zonen besitzt, tragen Sie die Angaben für die Seitentrennung nur bei einer Zone ein. Einträge in mehreren Zonen können zu einem unerwarteten Ergebnis führen.

Bedingung für die Seitentrennung

Geben Sie hier die Bedingung ein, die dafür sorgt, dass die Seitentrennung durchgeführt wird. Es können Wildcards oder reguläre Ausdrücke verwenden (nicht beides gleichzeitig).

Die Bedingung für die Seitentrennung wird auf den gefilterten Zoneninhalt angewendet.

Zoneninhalt filtern

Der Inhalt einer Zone kann anhand eines regulären Ausdruckes gefiltert werden. Das bedeutet, dass nicht der komplette Inhalt einer Zone in die Zielvariable übernommen wird, sondern nur das Ergebnis des regulären Ausdruckes, der auf den Inhalt angewendet wird.

Mit regulären Ausdrücken lassen sich sehr komplexe Suchen und Filter realisieren. So können von einer Rechnung z.B. die Rechnungsnummer, Rechnungsbetrag oder die IBAN gelesen werden. Dazu müssen diese Werte nicht an derselben Stelle einer Rechnung stehen. Auf einer Rechnung steht der Rechnungsbetrag möglicherweise mittig. Auf einer anderen eher rechts. So lange aber die Position durch einen regulären Ausdruck auffindbar ist (z.B. weil immer Netto davorsteht) werden die gewünschten Werte gefunden und in der Zonenvariable gespeichert.

Beispiel: Zwischen dem Wort Netto oder Betrag und dem Wort EUR oder € werden alle Zahlzeichen gefunden und mit zwei Stellen nach einem Punkt oder Komma ausgegeben.

(?<=Netto|Betrag)(:)*([\s]*|(EUR|€))*(((\d*(,|.))*\d{2}))*

Da man sich nicht hundertprozentig sicher sein kann, dass alle auf diese Weise gesuchten Werte korrekt erkannt wurden, eignet sich das Feature Dokumentenprüfung sehr gut um im WebClient die Werte zu überprüfen und ggf. zu korrigieren oder zu ergänzen, siehe auch Dokumentenüberprüfung.

Optionen

Anzahl Worte vom Anfang

Geben Sie hier an, wie viele Worte vom Anfang des erkannten Textes verwendet werden sollen (z.B. 1 verwendet nur das erste Wort des erkannten Textes als Zonen Text (in der Zonen-Vorschau zu sehen).